图像动漫_第6页

2025 年中国多模态大模型行业模型现状图像、视频、音频、3D 模型等终将打通和融合

行业主要上市公司：阿里巴巴 ( 09988.HK，BABA.US ) ; 百度 ( 09888.HK，BIDU.US ) ; 腾讯 ( 00700.HK， TCEHY ) ;科大讯飞 ( 002230.SZ ) ;万兴科技 ( 300624.SZ ) ;三六零

模型模态图像音频 3d模型 2025-06-03 18:00 10

公告丨公共安全视频图像信息系统管理有新规定啦！请查收！

第二条本条例所称公共安全视频图像信息系统（以下简称公共安全视频系统），是指通过在公共场所安装图像采集设备及相关设施，对涉及公共安全的区域进行视频图像信息收集、传输、显示、存储的系统。

视频公告管理图像公安 2025-06-03 17:23 8

令人难忘的图像展示了火星表面的火卫二

你唯一能听到的声音就是风的低语。这里没有拥挤的人群，也没有什么喧嚣（除非你碰巧被困在火星狂野的全球沙尘暴中）。然而，毅力号从杰泽罗陨石坑的孤寂有利位置拍摄的一张新照片，似乎传达了火星上无与伦比的宁静。

图像火星火卫一火星表面火卫二 2025-06-03 07:09 10

Flux.1 Kontext：用文字编辑图像

FLUX.1 Kontext 是来自 Black Forest Labs 的一款新图像编辑模型。它是用于通过文本提示编辑图像的最佳模型之一，并且是 FLUX.1 家族的最新成员。

图像 replica 文字编辑 kontext 文字编辑图像 2025-06-02 17:27 9

极低成本，复现GPT-4o图像风格化一致性！

不久前，GPT-4o 的最新图像风格化与编辑能力横空出世，用吉卜力等风格生成的效果令人惊艳，也让我们清晰看到了开源社区与商业 API 在图像风格化一致性上的巨大差距。

风格化图像 flux i2i 图像风格化 2025-06-01 20:18 6

厉剑：民国教材封面中的儿童图像与现代物品

民国教材封面的图像中，常常有象征现代生活的物品，如黑板、地球仪、收音机、火车、轮船等伴随儿童形象出现，这些物品或与教学活动相关，或与日常生活相关，体现出民国现代教育置身其间的现代化社会空间。以下从新式教具、现代电器两个方面解析民国封面儿童图像及其相关物品。

儿童民国教材图像厉剑 2025-06-01 20:14 7

美服数字科技申请基于人工智能的直播带货商品推送方法专利，快速生成虚拟主播图像用于直播推流

国家知识产权局信息显示，美服数字科技（广州）有限公司申请一项名为“一种基于人工智能的直播带货商品推送方法”的专利，公开号CN120075484A，申请日期为2025年02月。

直播主播人工智能图像专利 2025-05-31 12:21 7

BFL发布FLUX.1 Kontext套件，AI图像生成与编辑速度或领跑业界

近日，科技新闻界传来了一则关于Black Forest Labs（简称BFL）的创新消息。据悉，该公司推出了一款名为FLUX.1 Kontext的全新AI模型套件，专注于图像生成与编辑领域，且声称在速度上远超当前市场上的主流竞争对手。

图像套件 kontext bfl kontext套件 2025-05-31 10:18 10

中移软件申请模型训练及图像重建相关专利，可进行图像重建

国家知识产权局信息显示，中移(苏州)软件技术有限公司;中国移动通信集团有限公司申请一项名为“模型训练方法、图像重建方法、相关装置、设备、存储介质及计算机程序产品”的专利，公开号CN120070856A，申请日期为2025年01月。

软件训练模型图像专利 2025-05-31 10:01 9

BFL推出FLUX.1 Kontex模型套件，革新AI图像生成技术

科技媒体 WinBuzzer 昨日（5 月 30 日）发布博文，报道称 Black Forest Labs（BFL）推出全新 AI 模型套件 FLUX.1 Kontext，专注于生成与编辑上下文图像，号称速度比主流竞争对手快一个数量级。

模型图像套件 bfl kontex模型 2025-05-31 09:56 10

10%提升！RICO如何解决图像描述生成的老问题？

在2025年5月28日发布的arXiv预印本论文《RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction》中，研究者提出了一种突破性的图

模态图像 rico dpo 预印本 2025-05-30 23:56 8

实现GPT4o图像生成编辑能力BFL推出新一代多模态图像生成与编辑

只能通过文字控制，无法灵活结合图片作为上下文；无法连续编辑或保留角色特征，缺乏“认知连续性”；局部编辑需要复杂遮罩或 finetuning；多轮操作后常常图像退化（失真、风格丢失）；编辑速度慢，无法满足实时交互需求。

模态图像 gpt4o 模态图像 bfl 2025-05-30 17:41 12

AI生图大洗牌！流匹配架构颠覆传统，单模型同时接受文本图像输入

新模型FLUX.1 Kontext使用流匹配架构（Flow Matching），不再是文本编码器和扩散模型各干各的，与此前技术都不同。

模型架构图像绿龙 kontext 2025-05-30 16:54 7

悠优互娱取得基于人工智能的视频图像智能合成方法专利

国家知识产权局信息显示，苏州悠优互娱文化传媒有限公司取得一项名为“一种基于人工智能的视频图像智能合成方法”的专利，授权公告号CN119152411B，申请日期为2024年09月。

视频智能人工智能图像专利 2025-05-30 16:11 10

文远京行申请多车辆的图像处理相关专利，能够通过至少两个车辆协同进行图像处理以提高图像处理的效果

国家知识产权局信息显示，文远京行（北京）科技有限公司申请一项名为“多车辆的图像处理的方法、装置、电子设备及存储介质”的专利，公开号CN120075758A，申请日期为2024年12月。

图像处理图像专利存储介质文远 2025-05-30 10:42 7

AI图像生成如何突破算力瓶颈

2025年5月27日arXiv预印本披露的《Policy Optimized Text-to-Image Pipeline Design》研究，为文本生成图像领域带来了突破性进展。这项研究直面当前多组件工作流设计的两大痛点：传统方法需要消耗数百次完整图像生成的

图像工作流 pipeline 预印本词表 2025-05-29 21:34 9

开源免费图像浏览器 PicView 3.1.3

—————【下载地址】———————【本章下载一】：https://pan.quark.cn/s/bf75e9564a11【本章下载二】：https://pan.xunlei.com/s/VORGzDvb3r6FB4HEP1ZB_MzeA1?pwd=

浏览器免费开源图像 picview 2025-05-28 05:45 8

人大联合值得买科技在CVPR 2025提全新「图像到有声视频」生成框架

本文介绍工作由中国人民大学高瓴人工智能学院宋睿华团队、李崇轩、许洪腾与值得买科技 AI 团队共同完成。第一作者王希华是人大高瓴博士生（导师：宋睿华），他的研究兴趣主要在多模态生成，之前提出利用音频布局（audio layout）为视频生成同步声音的TiVA模型

视频图像人大宋睿 cvpr 2025-05-29 11:51 8

福建医科大学附属协和医院发表的11分论文被曝图像重复使用

2021年6月，福建医科大学附属协和医院在Journal of Experimental&ClinicalCancer Research（IF11.3997/1区）期刊上发表了一篇论文。在发表4年后，因图片与早期论文图片重复在pubpeer上被读者质疑。

论文肺腺癌图像 erk 福建医科大学附属协和医院 2025-05-29 10:35 9

Wandi Zhang：在虚构与真实之间，重组“梦核”的图像语言

她选取“家”作为出发点，却不以功能性场景为依托，而是将其转化为心理投射的载体——一个处于情绪浮层中的潜意识空间。她所构建的“家”，不再是可识别的生活场所，而是一种“似曾相识”却始终无法确认的场域：光源不稳定，结构略显畸变，房间之间的关系不再连贯，而是如梦境般被

图像语言 wandi faith wandizhang 2025-05-29 09:23 8